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Буководитоль поискового направления ВКонтакте 
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20 лет в поиске 
Когда-нибудь найду) 


Разрабатывал поиск, был менеджером, 
руководил продуктом и отвечаю 
за поисковое направление 


Богдан Гаркушин 


Руководитель поискового 
направления ВКонтакте 


О чем мы сегодня поговорим 


Движки Ранжирование 
- База данных - Формула вручную 
- Гисепе/\Лзра/Зрих... - МЛ 


- Сложный МЛ 


Архитектура 
- Репликация 


- Шардирование 


Появляются требования к Придуманной формулы Много пользователей и Несколько поисковых 
поиску со стороны недостаточно много поисков сервисов или большая 
пользователей команда поиска 


МУР Ранжирование Сложный МЛ Много данных 


Метрики качества поиска 


Аудиторные 
Поисковые 
- ВАУЛМАЦ/МАЧ - Поиски с 
результатами 


- Поисковые сессии 
- Поиски с кликами 


Конверсионные 


- Поиски с 
действиями 


МУР 


Появляются требования к Придуманной формулы 
поиску со стороны недостаточно 
пользователей 
Ранжирование Сложный МЛ 


МНОГО ПОИСКОВ 


Много пользователей и Несколько поисковых 


сервисов или большая 
команда поиска 


Много данных 


Продукт не 
запустили 


Все оценки Данных мало 


на бумаге 


Подготовка 


к МУР 


Нагрузки нет Результатов 


поиска мало 


Аудитории нет 


Как вы представляете себе поиск? 


дима 


РИН ВУ ОУКУВ Удалить из зей 

Й 
Санкт-Петербург ы т 
ВКонтакте 


Написать сообщение .- Позвонить 


Разрабатываем МУР и готовимся запуску 


Все максимально просто. Работа нацелена на максимальную простоту 


® в © 


Появляются требования к 
поиску со стороны 
пользователей 


Появились первые 
функциональные 
требования 


Нагрузка 
маленькая 


Продукт 
запустили 


Первые 


пользователи 


Аудитория 
небольшая 


Данных мало 


Результатов 
поиска мало 


Что нужно изменить в результатах? 


дима х © 


Дима Трундуков 
Санкт-Петербург 


Удалить из друзей 


ВКонтакте 


Написать сообщение .- Позвонить 


Оита Опоу 


обавить в зья 
Санкт-Петербург д Б 


СПОГУТ им. Бонч-Бруевича 


Написать сообщение 


Что нужно изменить в результатах? 


дима х © 


Дмитрий Костенко т 
| ) а Удалить из друзей 


НИУ ВШЭ (ГУ-ВШЭ) 


Написать сообщение . Позвонить 


ОтКгу \Латтт 
Добавить в друзья 
Написать сообщение 


На что повлияют наши изменения? 


Аудиторные 

Конверсионные 
- ВАУЛМАУ/МАЧУ я 
- Поисковые сессии действиями 


Появляется поисковый движок 


Поиск обеспечивается за счет движка, который регулярно синхронизирует свое состояние с 
базой данных сервиса 


р 
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+ интеграция с СУБД 
+ АР! для рПр, РУПоп, уауа 


№ 


/ЕЗРА 


+ векторный поиск 
+ ядро на С++ 
+ горизонтальное масштабирование 


+ поддержка МЛ 


+/- ориентирован на Кибетще5 


‹ 
\` 


Е азисоеагсп, 
ЗОВ 


+ Готовый движок на базе 1исепе 


+ Быстрый старт 


- Отстают от Шисепе 
- Проблемы при больших объемах 


[ исепе 


+ Популярная библиотека поиска 

+ Полнотекст, нечеткий поиск и ... 

+ Расширяется и кастомизируется 

+ Оптимизирован под современные процессоры 


- Это движок, поиск делать самостоятельно 


Ранжирование 


Продукт 
запустили 


Функциональные Данных много 
требования 
Много 
результатов 
поиска 
Нагрузка Результаты поиска 
маленькая 


не помещаются на 
экран устройства 


Аудитория 
небольшая 


Результатов 
больше 10 


алена кузьмина 


Алёна Кузьмина 
— Санкт-Петербург 


Школа кундалини йоги Амрит Нам 
Саровар СПб 


Написать сообщение . Позвонить 


Алена Кузьмина 

Москва 

Российское представительство в ООН 
Написать сообщение 


Алёна Кузьмина 
Санкт-Петербург 
Дом Астролога 
Написать сообщение 


Алёна Кузьмина 
Москва 

МГУ 

Написать сообщение 


х Ц 


Удалить из друзей 


Добавить в друзья 


Добавить в друзья 


Добавить в друзья 


Формула 


Мы все достаточно квалифицированны или считаем себя такими, чтобы точно сказать, что 
нужно пользователю, и придумать для него формулу ранжирования. 


Формула 


Придуманной формулы 
недостаточно 


Продукт 
запустили 


Функциональные 
требования 
Очень много 
результатов 
поиска 
Нагрузка 
маленькая 


Аудитория 
небольшая 


Данных много 


Результатов 
поиска очень много 


тимати х Ц 


Р езул ЬТ ато В о ® 


очень много 


Тимати Юнусов 
Подписаться 
Москва 


\_жиВ1аск ${аг Сгоири\ _* 
Написать сообщение 


Тимати Тимати 
Добавить в друзья 
Москва 


Написать сообщение 


Критерии 
- Звезды 


- Друзья 
- Новые знакомые 


- Соц. граф 


Тимати Тимати 
Добавить в друзья 
Москва 


Написать сообщение 


На что повлияют наши изменения? 


Аудиторные 

Конверсионные 
- ВАУЛМАУ/МАЧУ а 
- Поисковые сессии действиями 


Машинное обучение 


Машинное обучение - это онлайн и оффлайн процесс. В оффлайне мы работаем с историческими 
данными и подбираем формулу, в онлайне мы собираем то, что знаем здесь и сейчас и ранжируем 
согласно подобранной ранее формуле 


Сложный МЛ 


Комик в очках = 
Гарик Харламов 


Волшебник в очках 
= Гарри Поттер 


Лучше понимать 


пользователя 


Где искать новые 
ИСТОЧНИКИ ДЛЯ 
синонимов? 


Ведущий КВН = 
Александр Масляков 
Дмитрий Хрусталев 


Машинное обучение 


Много пользователей и 
много поисков 


Продукт 
запустили 


Функциональные Данных много 
требования 
Высокая 
нагрузка 
Нагрузка Результатов 
возросла поиска очень много 


Аудитория 
увеличилась 


Пользователей становится много 


АА 
м ®® 


Репликация 


Добавляем еще один или несколько абсолютно таких же поисковых серверов 


Балансер 


Много данных 


Функциональные 
требования 


Нагрузка 
возросла 


Продукт 
запустили 


Данных 
очень много 


Аудитория 
увеличилась 


Данные не 
помещаются на 
один сервер 


Результатов 
поиска очень много 


Шардирование 


Добавляем еще один или несколько поисковых серверов с другими данными. 


Несколько поисковых 
сервисов или большая 
команда поиска 


Количество сервисов увеличивается 


Архитектура поиска ВКонтакте 


Люди АР! Людей Балансер 


Сообщества > АР! Сообществ > Балансер —___ [Поиск БД 


Видео > АР! Видео —__> Балансер —» Поиск БД 


Балансер 


Поиски разные, а движок один 


17:03 ® 


С баста 


АП 


=%® > \азуа /УакшепКо У 
> ®® 


аж 
© \азуа Ваз{а 
® \/азуа Ваза 


„11 ПЕ ® 


© Сапсе 


пом а! 


Город дорог 


Са2до!аегм 


ЗПом/ а! 


\азуа УаКщепКо м“ Махт 


ЗВо\м ай 


Баста + Самара + 27.06.22 | Дв... 


Ем Ргапк Бу Баста 


Баста - Ростов 


5Вом/ а! 


Поиск 20 млн |54 


В Ко НТ акте пользователей в день поисковых кластера 


сегодня 
6 50 млн 


крупных сервисов поисков в сутки 


Альтернативная архитектура поиска 


Люди АР! Людей Физический сервер 


Появляются требования к Придуманной формулы Много пользователей и Несколько поисковых 
поиску со стороны недостаточно много поисков сервисов или большая 
пользователей команда поиска 


МУР Ранжирование Сложный МЛ Много данных 


Будем 
ВКонтакте! 


Богдан Гаркушин 


